Nvidia ve Araştırmacılar, Oyun Oynayan Yapay Zekalar için Daha Akıllı Eğitim Yöntemi Açıkladı
Nvidia, Politehnica University of Bucharest ve Mila Quebec AI Institute'dan araştırmacılarla birlikte, Macro-Action Similarity Penalty (MASP) adlı çığır açan bir pekiştirmeli öğrenme tekniği geliştirdi. Bu yöntem, makro-aksiyonlar—bir dizi kararın birleştirilmiş hali—arasındaki benzerlikleri tanımlayarak yapay zeka eğitimini hızlandırıyor ve video oyunları ile robotik gibi karmaşık ortamlarda daha verimli öğrenmeyi mümkün kılıyor.
MASP yaklaşımı, Breakout ve Street Fighter II gibi oyunlarda test edildiğinde, RAINBOW-DQN gibi yerleşik kıyaslamaları geride bırakarak üstün uyum yeteneği sergiledi. Bu teknik, otonom sistemler ve uyarlanabilir oyun yapay zekası gibi alanlarda umut vaat etse de, hesaplama yükü ve iyi tasarlanmış aksiyon setlerine bağımlılığı gibi uygulama zorlukları bulunuyor.